A Survey of Large Language Model based Autonomous Agents
https://scrapbox.io/files/65947c191e9a3c0023a8e92e.png
論文情報
タイトル:A Survey of Large Language Model based Autonomous Agents
著者:Lei Wang, Chen Ma, Xueyang Feng, Zeyu Zhang, Hao Yang, Jingsen Zhang
所属:Gaoling School of Artificial Intelligence, Renmin University of China
発刊日:2023年8月
論文の内容を簡単に
AI エージェントは4つの構成要素でできている
https://scrapbox.io/files/65947c78ae97bb0024f21704.png
https://scrapbox.io/files/65948385447009002451fd69.png
モデルの能力獲得までの変遷
https://scrapbox.io/files/65948317e62c0000235f594e.png
抄録
AIエージェントは、長年にわたり、学術界と産業界の両方で顕著な研究焦点となってきました。この分野の以前の研究は、しばしば隔離された環境内で限られた知識を持つエージェントを訓練することに焦点を当てており、これは人間の学習プロセスと大きく異なり、その結果、エージェントが人間のような決定を達成することは困難でした。しかし最近、大量のウェブ知識の獲得を通じて、大規模言語モデル(LLM)は人間レベルの知能を達成することにおいて顕著な可能性を示しています。これにより、LLMに基づくAIエージェントの研究が急増しています。本論文では、これらの研究の包括的な調査を提示し、LLMに基づく自律エージェントの分野に対する体系的なレビューを全体的な観点から行います。より具体的には、まずLLMに基づくAIエージェントの構築について議論し、以前の研究の大多数を包括する統一されたフレームワークを提案します。次に、社会科学、自然科学、工学の分野でのLLMに基づく自律エージェントの多様な応用について包括的な概観を提示します。最後に、LLMに基づく自律エージェントの一般的な評価戦略について深く掘り下げます。以前の研究に基づいて、この分野におけるいくつかの課題と将来の方向性も提示します。 Introduction
AIエージェントは長い間、人工一般知能(AGI)を達成するための有望なアプローチとして認識されてきました。これは、自己指向的な計画と行動を通じてタスクを達成することが期待されています。以前の研究では、エージェントは単純でヒューリスティックなポリシー関数に基づいて行動し、隔離された制限された環境で学習すると仮定されていました。このような仮定は、人間の学習プロセスと大きく異なります。なぜなら、人間の心は非常に複雑であり、個人はさまざまな環境から学習することができるからです。これらのギャップのため、以前の研究から得られたエージェントは、特に制約のないオープンドメインの設定で、人間レベルの意思決定プロセスを再現することはほとんどありません。
近年、大規模言語モデル(LLM)は顕著な成功を収め、人間のような知能を獲得する顕著な可能性を示しています。この能力は、包括的なトレーニングデータセットと多数のモデルパラメータを活用することから生じます。この能力に基づいて、LLMを中心的なコントローラとして使用し、人間のような意思決定能力を持つ自律エージェントを構築することに焦点を当てた成長分野があります。この方向性に沿って、研究者たちは多くの有望なモデルを開発しました。ここでの主要なアイデアは、LLMに記憶や計画などの重要な人間の能力を装備し、人間のように振る舞い、さまざまなタスクを効果的に完了させることです。以前は、これらのモデルは独立して提案され、全体的にまとめて比較する努力は限られていました。しかし、急速に発展するこの分野に関する体系的な要約は、それを包括的に理解し、将来の研究に触発するために非常に重要だと私たちは考えています。
この論文では、LLMに基づく自律エージェントの分野に関する包括的な調査を行います。具体的には、LLMに基づく自律エージェントの構築、応用、評価の3つの側面に基づいて調査を整理します。エージェントの構築については、(1)LLMをより活用するためにエージェントアーキテクチャをどのように設計するか、および(2)異なるタスクを完了するためにエージェントの能力をどのように刺激し強化するか、という2つの問題に焦点を当てます。直感的に、最初の問題はエージェントのハードウェアの基盤を構築することを目指し、2番目の問題はエージェントにソフトウェアリソースを提供することに焦点を当てます。最初の問題については、以前の研究のほとんどを包含することができる統一されたエージェントフレームワークを提示します。2番目の問題については、エージェントの能力獲得のための一般的に使用される戦略に関する要約を提供します。エージェントの構築について議論するだけでなく、社会科学、自然科学、工学におけるLLMに基づくAIエージェントの応用についても概観を提供します。最後に、LLMに基づく自律エージェントを評価するための戦略について深く掘り下げます。これは、主観的および客観的な戦略の両方に焦点を当てます。
要約すると、この調査はLLMに基づくAOエージェントの分野における既存の研究に対して体系的なレビューを行い、包括的な分類を確立します。私たちはエージェントの構築、応用、評価の3つの側面に焦点を当てます。以前の研究から、この分野のさまざまな課題を特定し、将来の方向性について議論します。私たちは、この分野はまだ初期段階にあると考えています。したがって、進行中の研究を追跡するためにリポジトリを維持しています。
https://scrapbox.io/files/65948083bc60e4002231629d.png